Thinking Machines曝LoRA终极指南:10倍学习率,媲美全参微调
LoRA能否与全参微调性能相当?在Thinking Machines的最新论文中,他们研究了LoRA与FullFT达到相近表现的条件。Thinking Machines关注LoRA,旨在推动其更广泛地应用于各种按需定制的场景,同时也有助于我们更深入审视机器学习
l thinking thinkingmachines 全参 2025-09-30 20:52 2
LoRA能否与全参微调性能相当?在Thinking Machines的最新论文中,他们研究了LoRA与FullFT达到相近表现的条件。Thinking Machines关注LoRA,旨在推动其更广泛地应用于各种按需定制的场景,同时也有助于我们更深入审视机器学习
l thinking thinkingmachines 全参 2025-09-30 20:52 2
简单来说,“got to talking” 比 “got to talk” 更强调“谈话”这个过程的持续性和渐进性。
incredible this party side,that might break your back and make your headlines while i was thinking you will respect me when you th
AI can generate false yet authoritative-sounding information.人工智能可以生成虚假但听起来权威的信息。Emotional manipulation accelerates the spread of
Complete homework carefully and correct homework in time to sort out the wrong sets-认真完成并订正作业,整理成错题本。
刚刚,陈丹琦悄悄入职OpenAI前员工密度最大实验室!她是IOI金牌得主、斯坦福博士,曾获最佳博士论文奖和多项学术荣誉,论文引用逾7万次。Thinking Machines又招到女科学家,这次有望更上一层楼了。
thinking 清 陈丹 thinkingmachines 2025-08-28 12:14 4
DeepSeek-V3.1,继承并进化自 V3 版本,在推理模式、工具调用、代码能力、长上下文支持等多个关键维度全面升级,访问链接即可在线体验:https://ai.gitee.com/serverless-api?model=DeepSeek-V3_1
北漂第19年,读书、健身、写作、成长。你关注的人决定你的价值观,关注我送李笑来《定投改变命运》、瑞达利欧《原则》、《创业120条金句》等电子书PDF。持续学习,长期主义者,带你一起成长!持续践行读书、健身、投资、帮朋友和陪家人!
农民 thinking farmer farmerdoing 2025-06-22 21:59 12
在追求知识与技能的道路上,基础知识犹如大厦的基石,起着根本性的支撑作用。无论是学习何种学科,或是掌握哪类技艺,扎实的基础知识都是开启深入探索之门的钥匙。没有稳固的基础,后续的学习就如同在空中楼阁上构建,摇摇欲坠,难以稳固发展。